Eric 船長這次介紹一個超棒服務,讓你可以觀看失落的網路內容
— 我是分隔線 —
通常網站關站後就看不到內容,但若是在這之前就加以儲存的話,便能夠將一些重要資訊保存下來,任何資訊都有可能消失,就算是放到網路上也不例外,而所謂網站時光機,就是一個網站服務,能夠藉由爬蟲程式(Crawler)蒐集網站內容並加以儲存,主要可以儲存網站曾經的內容,對於尋找資料來源、詳細時間都有很大的幫助,但有些部分無法正常儲存,如 Flash、PHP 等。
如果你是要找無名小站或 Yahoo 奇摩家族之類的網站的話雖然也能找到部分內容,不過資料並不是很完整。另外如果網站被設為私人,加密的相簿等等,是沒有辦法存檔的。
網頁存檔服務有很多種,但最出名的大概就是 Wayback Machine 了。Wayback Machine 是「網際網路檔案館」(Internet Archive)旗下的一項網頁保存計劃,只要他還在運作,每分每秒都不斷紀錄著,透過網路爬蟲抓取內容,並運用大量伺服器、頻寬來提供服務並極力節省資料大小,最古老的網頁備份便是剛創站時的年份。
我們也可自行提供線上「網頁備份」,在頁面 Save Page Now 輸入要備份的網頁網址,就能將大部分內容擷取下來,產生一個獨立且永久保存的備份,之後按圖索驥即可閱覽。
保存了大量 Flash 內容並搭配 ruffle 技術,讓大部分的內容得以播放。
和 cloudflare 合作,可說是「備份的備份」。
要知道,電子格式很容易就會變成無法讀取的狀態,不然就不會有數位黑暗時代的說法了,而網路時光機便是其中一個能避免這情況的辦法,這不僅可以紀錄網站曾經的歷史,還可紀錄消失的文章等等。
以我來說,我甚至有在上面成功找到失落的小說,因此它還是有價值的。
← To be continued